بهبود نرخ بازشناسی گفتار در شرایط نویزی با استفاده از روش های غیرخطی تبدیل ویژگی

thesis
abstract

یکی از مراحل اصلی در روند بازشناسی گفتار، استخراج ویژگی ها می باشد. در حقیقت ویژگی های مربوط به نمونه های هر کلاس باید بگونه ای از کلاس های دیگر متمایز شده باشند که سیستم بازشناسی گفتار در شرایط مختلف مانند نویز نیز عملکرد مناسبی از خود نشان دهد. تبدیل ویژگی می تواند پس از استخراج ویژگی بکار رود تا به این متمایزسازی کمک نماید. روش های تبدیل ویژگی را می توان به دو گروه خطی و غیرخطی تقسیم نمود. ویژگی های جدید در تبدیلات خطی براساس میانگین وزن دار ویژگی های اصلی بدست می آیند. اما تبدیلات غیرخطی با یک نگاشت غیرخطی عمل تبدیل را انجام می دهند. روش های مبتنی بر هسته و برخی روش های مبتنی بر خمینه از این گروه هستند. یکی از روش های تبدیل ویژگی مبتنی بر خمینه که دارای دو نسخه خطی و غیرخطی است، تصویر حافظ خصوصیات محلی (lpp) است که در بازشناسی گفتار و دیگر شاخه های بازشناسی الگو بکار گرفته شده است. علیرغم اینکه این روش برای بازشناسی گفتار در حضور نویز مفید به نظر می رسد، اما به تمایز بین واحدهای گفتاری توجه ندارد. از این رو هر دو نوع خطی و غیرخطی آن طوری اصلاح شده است که متمایزسازی بین کلاس ها را هم در نظر بگیرد. در این پایان نامه برای نخستین بار روش خطی تصویر حافظ خصوصیات محلی متمایزساز برای بازشناسی گفتار در حضور نویز پیشنهاد شده است . در این راستا دو روش اصلاح شده بکار گرفته شده است. از سوی دیگر پیشنهاد شده است که بجای تصویر حافظ خصوصیات محلی مبتنی بر هسته (نسخه غیر خطی با نام klpp) از ترکیب آنالیز مولفه های اصلی مبتنی بر هسته (kpca) با نسخه های خطی اصلی و متمایزساز تصویر حافظ خصوصیات محلی استفاده شود. به این ترتیب در ابتدا با استفاده از روش kpca متعامدسازی دادگان در فضایی غیرخطی با ابعاد بالاتر صورت می گیرد و سپس با استفاده از روش های مبتنی بر lpp دادگان با حفظ همسایگی به روی یک خمینه گفتاری نگاشت می یابند. این روش ها برای غلبه بر نویزهای توأم جمع پذیر و کانال پیشنهاد شدند. این روش ها بر روی دادگان aurora2 مورد ارزیابی و آزمایش قرار گرفته اند. نتایج نشان می دهد که روش های ترکیبی پیشنهادی دقت بازشناسی بهتری نسبت به روشی مشابه دارند. با استفاده از این روش ها درصد بازشناسی نسبت به سیستم پایه (ضرایب مل کپستروم) بطور متوسط در حدود 5/16? افزایش یافته است.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

بهبود نرخ بازشناسی ارقام دست نویس فارسی با استفاده از روش های ادغام در سطح ویژگی

هدف یک سیستم بازشناسی الگو، قرار دادن الگوها با کمترین خطا، در کلاس مربوط به خودشان است. بازشناسی ارقام دستنویس فارسی یکی از مسائل مهم در حوزه بازشناسی الگو می باشد. تحقیقات در این زمینه چندین دهه است که آغاز شده است و هنوز هم در حال تحول می باشد. در سیستم های اولیه بازشناسی الگو از یک ویژگی و یک طبقه بند استفاده می شد. این سیستمها برای بازشناسی الگوهای پیچیده و کاربردهای زمان حقیقی مشکل داشتند...

15 صفحه اول

روش های اتصال گرای جدید بر گرفته از سامانه ادراک گفتار انسان به منظور بهبود بازشناسی گفتار ماشینی

بازشناسی خودکار گفتار در شرایط عدم تطابق دادگان آموزش و آزمون، یکی از چالش های مهم در این مورد است. به منظور کاهش هر چه بیشتر این عدم تطابق، روش های مرسوم، سعی در بهسازی گفتار یا تطابق مدل آماری دارند. در این زمینه از جمله روش های دیگر می توان به آموزش مدل در شرایط مختلف اشاره کرد. موفقیت در این روش ها، در مقابل کارایی سیستم درک و بازشناسی در انسان بسیار ابتدایی به نظر می رسد...

full text

بهبود نرخ تشخیص احساس از روی گفتار با استفاده از تفکیک جنسیتی

تشخیص احساس از روی سیگنال گفتار یکی از شاخه‌های نسبتاً جدید در پردازش گفتار می‌باشد که می‌تواند در تعامل انسان و روبات نقش مهمی ایفا کند. در این مقاله ضمن استفاده از دو نوع ویژگی طیفی جدید به منظور افزایش نرخ بازشناسی به بررسی تاثیر جنسیت گویندگان در تشخیص احساس پرداخته شده است. ویژگی‌های یاد شده با استفاده از روش‌های پردازش تصویر، از تصویر طیف‌نگاره سیگنال گفتار استخراج می‌شوند . در این تحقیق ب...

full text

بهبود ویژگی ها با استفاده از الگوریتم های تکاملی برای بازشناسی مقاوم گفتار

متداول ترین و کاراترین ویژگی ها برای بازشناسی گفتار، ضرایب فرکانسی مل کپستروم هستند. این ویژگی ها از طریق اعمال تبدیل کسینوسی گسسته بر لگاریتم انرژیخروجی های بانک فیلترِ مِل بدست می آیند. تبدیل کسینوسی گسسته در حالت کلی در فشرده سازی و ناهمبسته سازی دادهها به صورت نیمه بهینه عمل می کند. این موضوع یکی از علل کاهش عملکرد ویژگی های مل کپستروم در محیطی است که نویزهای جمع پذیر وجود دارند. در این رساله...

ارائه یک روش نوین و کارآمد استخراج ویژگی برای بازشناسی گفتار مقاوم مبتنی بر تبدیل فوریه کسری و بهینه ساز تکامل تفاضلی

یکی از چالش های اساسی در تشخیص گفتار، استخراج ویژگی مقاوم نسبت به نویز می-باشد. در این مقاله یک الگوریتم استخراج ویژگی جدید که الگوریتم استخراج ضرائب کپسترال توان نرمالیزه شده کسری وفقی نامیده می‌شود، بعنوان یک روش مقاوم در برابر نویز برای کاربرد بازشناسی گفتار ارائه شده است. این روش استخراج ویژگی پیشنهادی مبتنی بر تبدیل فوریه گسسته کسری زمان کوتاه می‌باشد. از آنجایی که انتخاب ضریب تبدیل کسری ب...

full text

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه گیلان - دانشکده فنی

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023